www.国产精品一二区 _日韩在线国产精品_国产亚洲欧美激情_欧美日韩国产免费一区二区三区

國(guó)工數(shù)據(jù)大腦之多元線性回歸在化學(xué)研發(fā)中預(yù)測(cè)的應(yīng)用
2022-02-16
行業(yè)新聞

分享:

業(yè)務(wù)背景

    不管是制造業(yè)還是化工行業(yè),對(duì)于成本或產(chǎn)量控制、預(yù)測(cè)、決策都是生產(chǎn)管理中的重要組成部分。以成本控制為例,過去人們對(duì)成本控制的認(rèn)識(shí)比較狹隘,傳統(tǒng)的成本控制范圍局限于制造產(chǎn)品的過程,例如對(duì)成本形成過程中一些耗費(fèi)指標(biāo)的控制,使它不超過定額預(yù)算,如果發(fā)生差異,進(jìn)行差異計(jì)算和差異分析,以達(dá)到降低成本的目的。所以,傳統(tǒng)成本控制重點(diǎn)在生產(chǎn)過程中的差異計(jì)算和結(jié)束生產(chǎn)過程后的差異分析,是一種消極的成本控制。同時(shí),企業(yè)耗費(fèi)大量人力,物力收集的數(shù)據(jù)及指標(biāo)信息并沒有得到很好的利用,只是停留在表面的分析。而借助國(guó)工數(shù)據(jù)大腦平臺(tái)的多元線性回歸分析算法,不但可以做到對(duì)成本的事先控制,即對(duì)企業(yè)未來幾年的成本進(jìn)行預(yù)測(cè),還可以及早發(fā)現(xiàn)企業(yè)投入的成本不足或成本過剩的現(xiàn)象,幫助組織明確未來成本需求趨勢(shì),做好成本規(guī)劃工作,從而進(jìn)行準(zhǔn)確決策;而且可以復(fù)用歷史成本數(shù)據(jù)深度挖掘出有用的信息,探索出具有一般規(guī)律性和普遍適用性的成果。

多元線性回歸定義

    回歸分析是作為數(shù)據(jù)科學(xué)家需要掌握的第一個(gè)算法,是數(shù)據(jù)分析中最基礎(chǔ)最重要的分析工具,絕大多數(shù)的數(shù)據(jù)分析問題,都可以使用回歸的思想來解決?;貧w分析的任務(wù)就是,通過研究自變量X和因變量Y的數(shù)學(xué)關(guān)系式進(jìn)而達(dá)到通過X去預(yù)測(cè)Y的目的,它是數(shù)據(jù)分析中最常用的預(yù)測(cè)建模技術(shù)之一。即使在今天,大多數(shù)公司都使用回歸技術(shù)來實(shí)現(xiàn)大規(guī)模決策。其中包括了一元線性回歸方法、多元線性回歸方法和非線性回歸方法等。(線性指的是X、Y之間呈線性關(guān)系,不管X取什么值,都能在這條回歸直線上找到對(duì)應(yīng)的Y,如圖1,只要輸入X,Y的樣本數(shù)據(jù),數(shù)據(jù)大腦中的擬合回歸算法就能得到相應(yīng)的回歸直線)

圖1

    界定線性回歸是否為多元,主要看自變量(即X)的個(gè)數(shù),若自變量個(gè)數(shù)在兩個(gè)及其以上,則稱其為多元線性回歸,顯然若自變量個(gè)數(shù)有且只有一個(gè),稱為一元線性回歸。多元線性回歸的基本原理和一元線性回歸完全相同,區(qū)別只在于自變量的個(gè)數(shù)。
    在實(shí)際中,一個(gè)指標(biāo)的影響因素通常不止一個(gè),而是有若干個(gè)重要因素共同作用才導(dǎo)致事物的發(fā)展變化,因此在實(shí)際分析時(shí)多考慮多元回歸分析,本文以較為復(fù)雜的多元線性回歸為例。多元線性回歸模型的一般形式為:

    Y=a0+a1*X1+a2*X2+a3*X3…

    Y指的是因變量,即我們關(guān)注的指標(biāo)(成本或產(chǎn)量等);X指的是影響Y的因素。a1,a2,a3……指的是影響程度的大?。ㄓ址Q回歸系數(shù)大小)。
回歸分析的應(yīng)用

    回歸分析用于在許多業(yè)務(wù)情況下做出決策。回歸分析有三個(gè)主要應(yīng)用:
    1.解釋企業(yè)理解困難的事情。例如,為什么在上一季度的營(yíng)業(yè)額有所下降。
    2.預(yù)測(cè)重要的商業(yè)趨勢(shì)。例如,明年會(huì)要求他們的產(chǎn)品看起來像什么?
    3.選擇不同的替代方案。例如,我們應(yīng)該選擇原料A還是原料B?
進(jìn)行預(yù)測(cè)的前提

    當(dāng)我們求出回歸模型的具體表達(dá)式時(shí),還需要進(jìn)行統(tǒng)計(jì)意義檢驗(yàn),通過檢驗(yàn)才能使用該模型進(jìn)行預(yù)測(cè)。主要包括:擬合優(yōu)度檢驗(yàn)、回歸模型的總體顯著性檢驗(yàn)和回歸系數(shù)的顯著性檢驗(yàn)等。
    1. 擬合優(yōu)度檢驗(yàn)
    擬合優(yōu)度是指擬合的回歸模型與樣本觀測(cè)值之間的接近程度。即衡量一個(gè)回歸模型做的好不好的指標(biāo)。用決定系數(shù)(R-sq)表示,其數(shù)值區(qū)間為 0 ~ 1,越接近1,說明模型擬合得越好。判斷標(biāo)準(zhǔn)為:大于或等于0.7,認(rèn)為擬合優(yōu)度較好;在0.35~0.7之間,認(rèn)為擬合優(yōu)度較普通;小于0.35,認(rèn)為擬合優(yōu)度較差。
    2.回歸方程的顯著性檢驗(yàn)
    即檢驗(yàn)整個(gè)回歸方程的顯著性,或者說評(píng)價(jià)所有自變量x整體與因變量Y的線性關(guān)系是否密切,整個(gè)回歸方程本身是否有效。通常采用F檢驗(yàn)。
    3.回歸系數(shù)的顯著性
    若方程通過顯著性檢驗(yàn),并不意味著每個(gè)自變量對(duì)y的影響都顯著,所以就需要我們對(duì)每個(gè)自變量進(jìn)行顯著性檢驗(yàn)。若某個(gè)自變量系數(shù)對(duì)y影響不顯著,即無關(guān)的變量。我們需要從回歸方程中將其剔除。通常采用t檢驗(yàn)。

應(yīng)用場(chǎng)景

    成本高低不僅影響著化工行業(yè)企業(yè)的利潤(rùn),更是其公司發(fā)展壯大的一個(gè)制約因素。某有機(jī)新材料企業(yè)想要減少化學(xué)反應(yīng)中的原料剩余并預(yù)測(cè)在某種反應(yīng)參數(shù)變量取值下的原料剩余。原料剩余越少,成本利用率越高。把我們想要研究的對(duì)象原料剩余(Y)作為因變量,選取了4個(gè)主要影響因素:原料A的SM(X1);原料B的硝酸(X2);溫度(X3);反應(yīng)時(shí)間(X4)。并進(jìn)行22次試驗(yàn)?;?2次實(shí)驗(yàn)數(shù)據(jù)進(jìn)行多元線性回歸。

    初步得到線性回歸方程:Y=a0+a1*X1+a2*X2+a3*X3+a4*X4。

    首先,利用數(shù)據(jù)大腦中的多元線性回歸組件,就可得到回歸系數(shù):a1,a2,a3,a4的值。即把多元線性回歸組件拖到到工作面板,配置數(shù)據(jù)及組件參數(shù):將因變量和4個(gè)自變量分別拖到對(duì)應(yīng)的區(qū)域。過程如圖1:

    圖1配置好參數(shù)之后,其次點(diǎn)擊運(yùn)行,結(jié)果如下:



圖2


圖3

    由圖2可知,關(guān)于擬合優(yōu)度檢驗(yàn)方面,決定系數(shù)R-sq(即R方)=0.7526,說明該模型擬合優(yōu)度較好,因變量Y與自變量X1,X2,X3,X4具有較高的線性相關(guān)關(guān)系。從圖3可知:對(duì)于F檢驗(yàn),查F分布表可知,顯著性水平為0.1所對(duì)應(yīng)的F臨界值是2.31,F(xiàn)檢驗(yàn)統(tǒng)計(jì)量的值為5.5,故F統(tǒng)計(jì)量的值>臨界值,拒絕原假設(shè)。說明整個(gè)回歸模型是有效的,所有自變量整體對(duì)Y有影響。對(duì)于t檢驗(yàn),由圖2 顯示,在0.1的顯著性水平下,四個(gè)自變量的p值分別為:          p1=0008;p2=0.004;p3=0.0015;p4=0.0803,均小于0.1,故拒絕原假設(shè),進(jìn)一步表明每一個(gè)自變量對(duì)Y有顯著影響。綜上,所有結(jié)果顯示此回歸模型通過了統(tǒng)計(jì)意義的檢驗(yàn),說明此四元線性回歸模型是成立的,可以用于預(yù)測(cè)。已知a1=1.130,a2=-1.334;a3=-0.842;a4=-0.395。最終的多元線性回歸方程為:Y=0.002+1.1295 X1-1.3344 X2-0.8424X3-0.395 X4此方程的意義是:在假定其它自變量不變的情況下,原料A的SM(X1)每增長(zhǎng)1g,原料剩余就增長(zhǎng)1.1295g;在假定其它自變量不變的情況下,原料B的硝酸(X2)每增長(zhǎng)1g,原料剩余就減少1.3344g;在假定其它自變量不變的情況下,溫度(X3)每提高1攝氏度,原料剩余就減少0.8424g;在假定其它變量不變的情況下,反應(yīng)時(shí)間(X4)每提高1秒,原料剩余就減少0.395g;同時(shí),回歸系數(shù)a的絕對(duì)值越大,對(duì)Y的影響越大,可以看出a2的絕對(duì)值最大,為1.334。在決策方面,若該企業(yè)想減少原料剩余率,應(yīng)當(dāng)多關(guān)注原料B的情況。在預(yù)測(cè)方面:若下一次實(shí)驗(yàn)時(shí),假設(shè)X1=1.260,X2=-0.371,X3=-0.670;X4=0.770,則Y的預(yù)測(cè)值=0.002+1.1295*1.260-1.3344*(-0.371)-0.8424*(-0.670)-0.3947*0.770=2.179(g)。即原料剩余為2.179g,該企業(yè)可以將其與上一次實(shí)驗(yàn)進(jìn)行比較,從而進(jìn)行相應(yīng)的決策。


相關(guān)標(biāo)簽

推薦新聞
主站蜘蛛池模板: 安陆市| 苗栗县| 洱源县| 肇州县| 长武县| 海林市| 汝阳县| 合肥市| 游戏| 靖西县| 班戈县| 建水县| 恩施市| 都昌县| 离岛区| 陆川县| 榆林市| 孝昌县| 樟树市| 鲁山县| 松滋市| 维西| 庆安县| 乐清市| 叙永县| 承德市| 虎林市| 乐业县| 连城县| 黄梅县| 沁水县| 承德市| 遂宁市| 五莲县| 平和县| 山阴县| 松阳县| 普定县| 寿宁县| 湘乡市| 宣武区|